期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于SSD数据库负载的SQL能耗感知模型
李树, 于炯, 国冰磊, 蒲勇霖, 杨德先, 刘粟
计算机应用    2019, 39 (1): 205-212.   DOI: 10.11772/j.issn.1001-9081.2018051055
摘要562)      PDF (1350KB)(271)    收藏
面对大数据带来的能耗及环境方面的严峻问题,构建节能的绿色数据库系统已成为关键需求和重要挑战。针对现有数据库系统主要以性能优化为目标,缺少对能耗的感知及优化的问题,提出基于数据库负载的能耗感知模型,并将模型应用于基于固态硬盘(SSD)的数据库系统中。首先,将数据库负载执行过程中对主要系统资源(CPU、固态硬盘)的消耗解析为时间开销和功耗开销,并基于SSD数据库负载的基本I/O类型构建时间开销模型和功耗开销模型,实现为数据库构建资源开销单位统一的能耗感知模型;然后,利用多元线性回归实现对模型的求解,并分别在独占环境和竞争环境下,验证模型对不同I/O类型的数据库负载能耗估算的准确性;最后,分析实验结果,并讨论了影响模型准确性的因素。经实验验证模型准确度较高,在DBMS独占系统资源情况下的平均误差为5.15%,绝对误差不超过9.8%;竞争环境下的准确率相对下降,但平均误差也低于12.21%,可有效构建能耗感知的绿色数据库系统。
参考文献 | 相关文章 | 多维度评价
2. 基于Spark的ItemBased推荐算法性能优化
廖彬, 张陶, 国冰磊, 于炯, 张旭光, 刘炎
计算机应用    2017, 37 (7): 1900-1905.   DOI: 10.11772/j.issn.1001-9081.2017.07.1900
摘要560)      PDF (928KB)(381)    收藏
MapReduce计算场景下,复杂的大数据挖掘类算法通常需要多个MapReduce作业协作完成,但多个作业之间严重的冗余磁盘读写及重复的资源申请操作,使得算法的性能严重降低。为提高ItemBased推荐算法的计算效率,首先对MapReduce平台下ItemBased协同过滤算法存在的性能问题进行了分析;在此基础上利用Spark迭代计算及内存计算上的优势提高算法的执行效率,并实现了基于Spark平台的ItemBased推荐算法。实验结果表明:当集群节点规模分别为10与20时,算法在Spark中的运行时间分别只有MapReduce中的25.6%及30.8%,Spark平台下的算法相比MapReduce平台,执行效率整体提高3倍以上。
参考文献 | 相关文章 | 多维度评价
3. 基于聚类层次模型的视频推荐算法
金亮, 于炯, 杨兴耀, 鲁亮, 王跃飞, 国冰磊, 廖彬
计算机应用    2017, 37 (10): 2828-2833.   DOI: 10.11772/j.issn.1001-9081.2017.10.2828
摘要585)      PDF (1025KB)(669)    收藏
目前推荐系统存在评论数据稀疏、冷启动和用户体验度低等问题,为了提高推荐系统的性能和进一步改善用户体验,提出基于聚类层次模型的视频推荐算法。首先,从相关用户方面着手,通过近邻传播(AP)聚类分析得到相似用户,从而收集相似用户中的历史网络视频数据,进而形成视频推荐集合;其次,利用用户行为的历史数据计算出用户对视频的喜好值,再把视频的喜好值转换成视频的标签权重;最后,通过层次分析模型算出视频推荐集合中用户喜好视频的排序,产生推荐列表。基于MovieLens Latest Dataset和YouTube视频评论文本数据集,实验结果表明所提算法在均方根误差和决策精度方面均表现出良好的性能。
参考文献 | 相关文章 | 多维度评价
4. 结构化查询语言动态功耗解析及建模
国冰磊, 于炯, 廖彬, 杨德先
计算机应用    2015, 35 (12): 3362-3367.   DOI: 10.11772/j.issn.1001-9081.2015.12.3362
摘要518)      PDF (923KB)(324)    收藏
为构建节能的绿色数据库,提出一种基于结构化查询语言(SQL)资源(中央处理单元(CPU)、磁盘)消耗的最小单位的数据库动态能耗模型。该模型对系统动态能耗进行解析,将系统主要硬件(CPU、磁盘)的资源消耗映射成功率消耗,采用多元线性回归方法拟合模型关键参数,实时地估算系统动态功率,构建单位统一的动态功耗模型。实验结果表明,相比基于元组总数的模型,CPU指令总数能更好地反映CPU的功率消耗,所构模型在数据库管理系统(DBMS)独占系统资源的静态环境下,平均相对误差小于6%,绝对误差不超过9%。该动态功耗模型更适合于构建节能的绿色数据库。
参考文献 | 相关文章 | 多维度评价